keywords:"frequent patterns" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"frequent patterns"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Computational tasks for Parallel data processing course Horečný, Peter ; Rajnoha, Martin (oponent) ; Mašek, Jan (vedoucí práce) The goal of this thesis was to create laboratory excercises for subject „Parallel data processing“, which will introduce options and capabilities of Apache Spark technology to the students. The excercises focus on work with basic operations and data preprocessing, work with concepts and algorithms of machine learning. By following the instructions, the students will solve real world situations problems by using algorithms for linear regression, classification, clustering and frequent patterns. This will show them the real usage and advantages of Spark. As an input data, there will be databases of czech and slovak companies with a lot of information provided, which need to be prepared, filtered and sorted for next processing in the first excercise. The students will also get known with functional programming, because the are not whole programs in excercises, but just the pieces of instructions, which are not repeated in the following excercises. They will get a comprehensive overview about possibilities of Spark by getting over all the excercices. Úplný záznam
	Dolování asociačních pravidel Dvořák, Michal ; Chmelař, Petr (oponent) ; Stryka, Lukáš (vedoucí práce) Cílem této bakalářské práce je návrh a implementace aplikace umožňující porovnávat výkonnost a časovou náročnost zvolených algoritmů pro dolování frekventovaných množin a asociačních pravidel. Pro demonstraci byly vybrány dolovací algoritmy Apriori, AprioriTIDList, AprioriItemSet a metoda s využitím FP-stromu. Testování probíhalo nad různými objemy dat a s různými hodnotami minimální podpory a spolehlivosti. Aplikace je implementována v objektově orientovaném jazyce C# a jako zdroj dat slouží relační databáze na MS SQL Server 2008. Úplný záznam
	Získávání znalostí z datových skladů Pumprla, Ondřej ; Chmelař, Petr (oponent) ; Stryka, Lukáš (vedoucí práce) Diplomová práce se zabývá principy procesu získávání znalostí se zaměřením na asociační pravidla. Je vybudován teoretický aparát obecného popisu a principů tvorby datových skladů. Na základě těchto teoretických poznatků je implementována aplikace pro získávání asociačních pravidel. Aplikace očekává data buď v transakční nebo multidimenzionální podobě ve schématu hvězdy. Implementované algoritmy na hledání frekventovaných množin jsou Apriori a FP-strom. Systém umožňuje variantní nastavení parametrů dolování a byly provedeny ověřovací výkonnostní testy. Z pohledu podpory hledání asociačních pravidel se výsledná aplikace jeví robustnější než existující porovnávané systémy SAS a Oracle Data Miner. Úplný záznam
	Computational tasks for Parallel data processing course Horečný, Peter ; Rajnoha, Martin (oponent) ; Mašek, Jan (vedoucí práce) The goal of this thesis was to create laboratory excercises for subject „Parallel data processing“, which will introduce options and capabilities of Apache Spark technology to the students. The excercises focus on work with basic operations and data preprocessing, work with concepts and algorithms of machine learning. By following the instructions, the students will solve real world situations problems by using algorithms for linear regression, classification, clustering and frequent patterns. This will show them the real usage and advantages of Spark. As an input data, there will be databases of czech and slovak companies with a lot of information provided, which need to be prepared, filtered and sorted for next processing in the first excercise. The students will also get known with functional programming, because the are not whole programs in excercises, but just the pieces of instructions, which are not repeated in the following excercises. They will get a comprehensive overview about possibilities of Spark by getting over all the excercices. Úplný záznam
	Dolování asociačních pravidel Dvořák, Michal ; Chmelař, Petr (oponent) ; Stryka, Lukáš (vedoucí práce) Cílem této bakalářské práce je návrh a implementace aplikace umožňující porovnávat výkonnost a časovou náročnost zvolených algoritmů pro dolování frekventovaných množin a asociačních pravidel. Pro demonstraci byly vybrány dolovací algoritmy Apriori, AprioriTIDList, AprioriItemSet a metoda s využitím FP-stromu. Testování probíhalo nad různými objemy dat a s různými hodnotami minimální podpory a spolehlivosti. Aplikace je implementována v objektově orientovaném jazyce C# a jako zdroj dat slouží relační databáze na MS SQL Server 2008. Úplný záznam
	Získávání znalostí z datových skladů Pumprla, Ondřej ; Chmelař, Petr (oponent) ; Stryka, Lukáš (vedoucí práce) Diplomová práce se zabývá principy procesu získávání znalostí se zaměřením na asociační pravidla. Je vybudován teoretický aparát obecného popisu a principů tvorby datových skladů. Na základě těchto teoretických poznatků je implementována aplikace pro získávání asociačních pravidel. Aplikace očekává data buď v transakční nebo multidimenzionální podobě ve schématu hvězdy. Implementované algoritmy na hledání frekventovaných množin jsou Apriori a FP-strom. Systém umožňuje variantní nastavení parametrů dolování a byly provedeny ověřovací výkonnostní testy. Z pohledu podpory hledání asociačních pravidel se výsledná aplikace jeví robustnější než existující porovnávané systémy SAS a Oracle Data Miner. Úplný záznam
	Získávání frekventovaných vzorů z proudu dat Dvořák, Michal ; Hlosta, Martin (oponent) ; Zendulka, Jaroslav (vedoucí práce) Dolování frekventovaných vzorů z databází je již dobře prozkoumanou oblastí. Jak se však ukázalo, tyto algoritmy nejsou příliš vhodné pro zpracování proudu dat. Při dolování frekventovaných množin v proudu dat se musí udržovat kromě jednotlivých množin i jejich historie - a to nejen těch frekventovaných, ale i potenciálně frekventovaných, neboť nefrekventovaná množina se může stát časem frekventovanou. To zvyšuje nároky jak na paměť, tak na výpočetní výkon. Tato práce popisuje dva algoritmy: Lossy Counting a FP-stream. Součástí je také efektivní implementace těchto algoritmů v jazyce C# a jejich porovnání na základě měření. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English